#!/usr/bin/env python
# coding: utf-8

# In[12]:


import pandas as pd
df1 = pd.read_excel("/Users/andy/Downloads/df2.xlsx")
#缺失值的处理
df1.info()  # 显示报表的信息, 可用于查看是否有缺失值
df1.dropna() # 这个方法会删除所有带有空白单元格的行, 如果需要删除整行空白, 传入参数how = "all"
df1.fillna({"XXX":"AAA"}) #填充缺失值, method="pad"用前一个数值填充, method="bfill"用后一个数值填充

#重复值的处理
df1.drop_duplicates(subset = ["所属战区","责任督导"], keep = "last") 
#删除重复值, 用subset来指定删除哪些列; keep的参数有last first, False(把所有重复值删除)

#异常值的处理
df1["所属战区"].astype("float64")  #转化数据类型
df1.set_index("所属战区")  #设置对应的列作为索引
df1.rename(columns = {"责任督导":"市场督导"}, index = )   #重命名索引
df1.reset_index(level=None, drop=False, inplace=False)   #重置索引


# In[ ]:





# In[ ]:





# In[ ]:




